智能论文笔记

MSVIPER: Improved Policy Distillation for Reinforcement-Learning-Based Robot Navigation

Aaron M. Roth , Jing Liang , Ram Sriram , Elham Tabassi , Dinesh Manocha

分类：机器人 | 人工智能 | 机器学习

2022-09-19

我们通过策略提取（MSVIPER）提出了多种可验证的增强学习，这是一种策略蒸馏到决策树以改进机器人导航的新方法。 MSVIPER使用任何强化学习（RL）技术来学习一项“专家”政策，涉及学习国家行动映射，然后使用模仿学习来从中学习决策树策略。我们证明，MSVIPER会导致有效的决策树，并可以准确模仿专家政策的行为。此外，我们提出了有效的政策蒸馏和树修改技术，这些技术利用决策树结构，可以改进政策而无需再培训。我们使用我们的方法来改善用于室内和室外场景的基于RL的机器人导航算法的性能。我们证明了在减少冻结和振荡行为（减少95 \％降低）方面的好处。

translated by 谷歌翻译

Application of Group Method of Data Handling and New Optimization Algorithms for Predicting Sediment Transport Rate under Vegetation Cover

Golnaz Mirzakhani , Elham Ghanbari-Adivi , Rohollah Fattahi , Mohammad Ehteram , Amir Mosavi , Ali Najah Ahmed , Ahmed El-Shafieg

分类：机器学习

2022-09-16

种植植被是降低沉积物转移率的实用解决方案之一。植被覆盖的增加可降低环境污染和沉积物的运输速率（STR）。由于沉积物和植被相互作用复杂，因此预测沉积物的运输速率具有挑战性。这项研究旨在使用新的和优化的数据处理方法（GMDH）的新版本（GMDH）预测植被覆盖的沉积物传输速率。此外，这项研究介绍了一种用于预测沉积物传输速率的新集合模型。模型输入包括波高，波速，密度覆盖，波力，D50，植被盖的高度和盖茎直径。独立的GMDH模型和优化的GMDH模型，包括GMDH Honey Badger算法（HBA）GMDH大鼠群群算法（RSOA）VGMDH正弦余弦算法（SCA）和GMDH颗粒swarm swarm优化率（GMDH-PSO），用于预测沉积率（GMDH-PSO）。作为下一步，使用独立的GMDH的输出来构建集合模型。合奏模型的MAE为0.145 m3/s，而GMDH-HBA，GMDH-RSOA，GMDH-SCA，GMDH-PSOA和GMDH的MAE在测试水平为0.176 M3/s，0.312 M3/s，0.367/s，0.367 M3/s，0.498 m3/s和0.612 m3/s。集合模型的Nash Sutcliffe系数（NSE），GMDH-HBA，GMDH-RSOA，GMDH-SCA，GMDH-PSOA和GHMDH分别为0.95 0.93、0.89、0.89、0.86、0.86、0.82和0.76。此外，这项研究表明，植被覆盖的沉积物运输速率降低了90％。结果表明，合奏和GMDH-HBA模型可以准确预测沉积物的传输速率。根据这项研究的结果，可以使用IMM和GMDH-HBA监测沉积物的传输速率。这些结果对于管理和规划大盆地的水资源很有用。

translated by 谷歌翻译

Data Science and Machine Learning in Education

Gabriele Benelli , Thomas Y. Chen , Javier Duarte , Matthew Feickert , Matthew Graham , Lindsey Gray , Dan Hackett , Phil Harris , Shih-Chieh Hsu , Gregor Kasieczka

分类：机器学习

2022-07-19

鉴于HEP研究的核心，数据科学（DS）和机器学习（ML）在高能量物理学（HEP）中的作用增长良好和相关。此外，利用物理数据固有的对称性激发了物理信息的ML作为计算机科学研究的充满活力的子场。 HEP研究人员从广泛使用的材料中受益匪浅，可用于教育，培训和劳动力开发。他们还为这些材料做出了贡献，并为DS/ML相关的字段提供软件。物理部门越来越多地在DS，ML和物理学的交集上提供课程，通常使用HEP研究人员开发的课程，并涉及HEP中使用的开放软件和数据。在这份白皮书中，我们探讨了HEP研究与DS/ML教育之间的协同作用，讨论了此交叉路口的机会和挑战，并提出了将是互惠互利的社区活动。

translated by 谷歌翻译

Single MR Image Super-Resolution using Generative Adversarial Network

Shawkh Ibne Rashid , Elham Shakibapour , Mehran Ebrahimi

分类：计算机视觉 | 机器学习

2022-07-16

可以使用超分辨率方法改善医学图像的空间分辨率。实际增强的超级分辨率生成对抗网络（Real-Esrgan）是最近用于产生较高分辨率图像的最新有效方法之一，给定较低分辨率的输入图像。在本文中，我们应用这种方法来增强2D MR图像的空间分辨率。在我们提出的方法中，我们稍微修改了从脑肿瘤分割挑战（BRATS）2018数据集中训练2D磁共振图像（MRI）的结构。通过计算SSIM（结构相似性指数量度），NRMSE（归一化根平方误），MAE（平均绝对误差）和VIF（视觉信息保真度）值，通过计算SSIM（结构相似性指数量度）进行定性和定量验证。

translated by 谷歌翻译

Kaggle Competition: Cantonese Audio-Visual Speech Recognition for In-car Commands

Wenliang Dai , Samuel Cahyawijaya , Tiezheng Yu , Elham J Barezi , Pascale Fung

分类：自然语言处理

2022-07-06

随着深度学习和智能车辆的兴起，智能助手已成为促进驾驶和提供额外功能的重要车内组件。车内智能助手应该能够处理一般以及与汽车相关的命令并执行相应的操作，从而简化驾驶并提高安全性。但是，在这个研究领域，大多数数据集都采用主要语言，例如英语和中文。对于低资源语言，存在一个巨大的数据稀缺问题，阻碍了对更广泛社区的研究和应用的发展。因此，至关重要的是，拥有更多的基准来提高认识并激发低资源语言的研究。为了减轻此问题，我们收集了一个新的数据集，即广东话音频 - 视听语音识别（CI-AVSR），以使用视频和音频数据在广东话中使用拼写语言识别。与此同时，我们提出了广东话音频的语音识别在车内命令，这是社区在车内场景下应对低资源语音识别的新挑战。

translated by 谷歌翻译

Ultra-low latency recurrent neural network inference on FPGAs for physics applications with hls4ml

Elham E Khoda , Dylan Rankin , Rafael Teixeira de Lima , Philip Harris , Scott Hauck , Shih-Chieh Hsu , Michael Kagan , Vladimir Loncar , Chaitanya Paikara , Richa Rao

分类：机器学习 | (统计)机器学习

2022-07-01

复发性神经网络已被证明是高能量物理中许多任务的有效体系结构，因此已被广泛采用。然而，由于在现场可编程门阵列（FPGAS）上实现经常性体系结构的困难，它们在低延迟环境中的使用受到了限制。在本文中，我们介绍了HLS4ML框架内两种类型的复发性神经网络层（长期短期内存和封闭式复发单元）的实现。我们证明，我们的实施能够为小型和大型模型生产有效的设计，并且可以定制以满足推理潜伏期和FPGA资源的特定设计要求。我们显示了多个神经网络的性能和合成设计，其中许多是专门针对CERN大型强子对撞机的喷气识别任务的培训。

translated by 谷歌翻译

Machine Learning-Driven Process of Alumina Ceramics Laser Machining

Razyeh Behbahani , Hamidreza Yazdani Sarvestani , Erfan Fatehi , Elham Kiyani , Behnam Ashrafi , Mikko Karttunen , Meysam Rahmat

分类：机器学习

2022-06-13

激光加工是一种高度灵活的非接触式制造技术，在学术界和行业中广泛使用。由于光和物质之间的非线性相互作用，模拟方法非常重要，因为它们通过理解激光处理参数之间的相互关系来帮助增强加工质量。另一方面，实验处理参数优化建议对可用处理参数空间进行系统且耗时的研究。一种智能策略是采用机器学习（ML）技术来捕获Picsecond激光加工参数之间的关系，以找到适当的参数组合，以创建对工业级氧化铝陶瓷的所需削减，并具有深层，平滑和无缺陷的模式。激光参数，例如梁振幅和频率，扫描仪的传递速度以及扫描仪与样品表面的垂直距离的速度，用于预测深度，最高宽度和底部宽度使用ML型号雕刻通道。由于激光参数之间的复杂相关性，因此表明神经网络（NN）是预测输出最有效的。配备了ML模型，该模型可以捕获激光参数与雕刻通道尺寸之间的互连，可以预测所需的输入参数以实现目标通道几何形状。该策略大大降低了开发阶段实验激光加工的成本和精力，而不会损害准确性或性能。开发的技术可以应用于各种陶瓷激光加工过程。

translated by 谷歌翻译

Compositional optimization of quantum circuits for quantum kernels of support vector machines

Elham Torabian , Roman V. Krems

分类：机器学习

2022-03-25

While quantum machine learning (ML) has been proposed to be one of the most promising applications of quantum computing, how to build quantum ML models that outperform classical ML remains a major open question. Here, we demonstrate a Bayesian algorithm for constructing quantum kernels for support vector machines that adapts quantum gate sequences to data. The algorithm increases the complexity of quantum circuits incrementally by appending quantum gates selected with Bayesian information criterion as circuit selection metric and Bayesian optimization of the parameters of the locally optimal quantum circuits identified. The performance of the resulting quantum models for classification problems with a small number of training points significantly exceeds that of optimized classical models with conventional kernels.

translated by 谷歌翻译

CI-AVSR: A Cantonese Audio-Visual Speech Dataset for In-car Command Recognition

Wenliang Dai , Samuel Cahyawijaya , Tiezheng Yu , Elham J. Barezi , Peng Xu , Cheuk Tung Shadow Yiu , Rita Frieske , Holy Lovenia , Genta Indra Winata , Qifeng Chen

分类：自然语言处理 | 人工智能

2022-01-11

随着深度学习和智能车辆的兴起，智能助手已成为促进驾驶和提供额外功能的基本内部组件。汽车智能助理应该能够处理一般的和与汽车有关的命令，并执行相应的操作，减轻驾驶和提高安全性。但是，对于低资源语言存在数据稀缺问题，妨碍了研究和应用的发展。在本文中，我们介绍了一个新的DataSet，粤式视听语音识别（CI-AVSR），用于粤语中的车载命令识别，具有视频和音频数据。它由令人宣传的30个粤语发言者记录的200个车载命令的4,984个样本（8.3小时）组成。此外，我们使用常见的内部内部背景噪声增强我们的数据集来模拟真实环境，产生比收集的数据集大10倍。我们提供我们数据集的清洁和增强版本的详细统计信息。此外，我们实施了两个多模式基线以证明CI-AVSR的有效性。实验结果表明，利用视觉信号提高了模型的整体性能。虽然我们的最佳模型可以在清洁测试集上实现相当大的质量，但嘈杂数据的语音识别质量仍然是较差的，并且仍然是真正的车载语音识别系统的极其具有挑战性的任务。数据集和代码将在https://github.com/hltchkust/ci-avsr发布。

translated by 谷歌翻译

Automatic Speech Recognition Datasets in Cantonese Language: A Survey and a New Dataset

Tiezheng Yu , Rita Frieske , Peng Xu , Samuel Cahyawijaya , Cheuk Tung Shadow Yiu , Holy Lovenia , Wenliang Dai , Elham J. Barezi , Qifeng Chen , Xiaojuan Ma

分类：自然语言处理

2022-01-07

低资源语言的自动语音识别（ASR）改善了语言少数群体的访问，以便人工智能（AI）提供的技术优势。在本文中，我们通过创建一个新的粤语数据集来解决香港广东语言的数据稀缺问题。我们的数据集多域粤语语料库（MDCC）由73.6小时的清洁阅读语音与成绩单配对，从香港的粤语有声读物收集。它结合了哲学，政治，教育，文化，生活方式和家庭领域，涵盖了广泛的主题。我们还查看所有现有的粤语数据集，并在两个最大的数据集（MDCC和公共语音ZH-HK）上执行实验。我们根据其语音类型，数据源，总大小和可用性分析现有数据集。使用Fairseq S2T变压器，最先进的ASR模型进行实验结果，显示了我们数据集的有效性。此外，我们通过在MDCC和常见的声音ZH-HK上应用多数据集学习来创建一个强大而强大的粤语ASR模型。

translated by 谷歌翻译